文件读取与存储
1> CSV 文件
① read_csv
pandas.read_csv(filepath_or_buffer, sep =',', usecols )
| 参数 | 说明 |
|---|---|
| filepath_or_buffer | 文件路径 |
| sep | 分隔符,默认用","隔开 |
| usecols | 指定读取的列名,列表形式 |
# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])
open close
2018-02-27 23.53 24.16
2018-02-26 22.80 23.53
2018-02-23 22.88 22.82
2018-02-22 22.25 22.28
2018-02-14 21.49 21.92
② to_csv
DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, mode='w', encoding=None)
| 参数 | 说明 |
|---|---|
| path_or_buf | 文件路径 |
| sep | 分隔符,默认用","隔开 |
| columns | 选择需要的列索引 |
| header | boolean or list of string, default True,是否写进列索引值 |
| index | 是否导出索引 |
| mode | 'w':重写, 'a' 追加 |
# 选取10行数据保存,便于观察数据
data[:10].to_csv("./data/test.csv", columns=['open'])
2> HDF5
HDF5文件的读取和存储需要指定一个键,值为要存储的DataFrame;
需要安装tables模块避免不能读取HDF5文件 : pip install tables
pandas.read_hdf(path_or_buf,key =None,** kwargs)
| 参数 | 说明 |
|---|---|
| path_or_buf | 文件路径 |
| key | 读取的键 |
# 读取文件
day_close = pd.read_hdf("./data/day_close.h5", key="day_close")
# 存储数据
day_close.to_hdf("./data/test.h5", key="day_close")